Mecanismo SuperActivador: Transformers concentran señales de concepto en cola
Los SuperActivadores: tokens de cola en Transformers que señalan conceptos con alta fiabilidad, mejorando la detección en 0.14 F1. ¡Descubre el mecanismo!
Los SuperActivadores: tokens de cola en Transformers que señalan conceptos con alta fiabilidad, mejorando la detección en 0.14 F1. ¡Descubre el mecanismo!
La inyección de ruido secuencial en subespacios evita colapso de precisión en desaprendizaje certificado. Mejora la utilidad del modelo.
Extrae algoritmos interpretables de un Transformer Discreto. Descubre cómo convertir pesos neuronales en código legible para una IA más explicable.
Descubre cómo reestructurar la comunicación entre robots mejora un 47% el rendimiento, frente al 9% de escalar modelos. Estudio con 10 robots reales.
LLMs sin Deep Learning: nueva arquitectura RBF que encuentra el óptimo global en una iteración, eliminando el tedioso entrenamiento.
Descubre cómo los LLM actúan como ingenieros de datos autónomos para especializar modelos, logrando mejoras de rendimiento de hasta 57%.
Descubre un marco teórico que unifica los algoritmos de agregación de gradientes para optimización multiobjetivo, con nuevas garantías de convergencia y aplicac
GC-MoE asigna expertos congelados personalizados a cada nodo vial, mejorando precisión en pronóstico de tráfico con solo 17K parámetros.
Descubre cómo mejoramos la estimación de distribuciones discretas bajo norma infinito con nuevas cotas minimax y resultados empíricos prometedores.
Descubre LARK: selecciona trayectorias de razonamiento basadas en la aprendibilidad del estudiante para una destilación eficiente. ¡Optimiza tus modelos!
CobSeg mejora la segmentación de temas en diálogos sin LLM. Reduce errores en benchmarks. Ideal para apps humano-IA.
Descubre cómo los LLMs reflejan la incertidumbre humana mediante alineación, calibración y patrones de activación. Un estudio clave para entender y combatir alucinaciones.
Descubre dashi, la librería Python para analizar deriva de datos. Mejora la confiabilidad de tu IA con métricas y visualizaciones.
Descubre cómo la inyección del algoritmo CYK en redes neuronales supera a LLMs de 20B en análisis sintáctico. ¡Un salto neuro-simbólico!
FiVeD: verificación de grano fino para mejorar la extracción de tripletes de sentimiento. Aumenta F1 hasta 3.53. Ideal para sistemas de opinión.
Investigación revela que VLMs suprimen representaciones femeninas en imágenes ambiguas, incluso en ocupaciones estereotipadas femeninas. Conoce la métrica LALS.
Descubre cómo las cabezas de atención posicionales y simbólicas aprenden en Transformers, su geometría RoPE y generalización de longitud.
Descubre cómo un nuevo enfoque unifica y optimiza la valoración de datos usando decisiones secuenciales, mejorando la selección en LLM y benchmarks clásicos.
Descubre ProofWala, un framework open-source para síntesis de pruebas multilingüe y demostración de teoremas con IA. Acelera tu investigación.
Descubre cómo los modelos de lenguaje infieren eventos a partir de series temporales usando datos deportivos. Un nuevo benchmark y técnicas de destilación mejoran el rendimiento.